How Amazon scaled Rufus by building multi-node inference using AWS Trainium chips and vLLM
在这篇文章中,亚马逊分享了他们如何使用Amazon Trainium Chips和VLLM为其生成的AI购物助理Rufus开发多节点推理解决方案,以大规模提供大型语言模型。该解决方案结合了领导者/追随者编排模型,混合并行性策略以及在亚马逊ECS上构建的多节点推理单元抽象层,以跨多个节点部署模型,同时保持高性能和可靠性。
Build an intelligent financial analysis agent with LangGraph and Strands Agents
这篇文章描述了一种结合三种强大技术的方法,以说明您可以适应并构建特定财务分析需求的体系结构:工作流程编排的langgraph,用于结构化推理的链代理以及用于工具集成的模型上下文协议(MCP)。
Amazon Bedrock AgentCore Memory: Building context-aware agents
在这篇文章中,我们探索了Amazon Bedrock AgentCore Memory,这是一项完全管理的服务,使AI代理能够保持直接和长期知识,将一次性的对话转变为用户与AI代理之间的连续,不断发展的关系。该服务消除了复杂的内存基础架构管理,同时提供了对AI代理所记住的内容的完全控制,为维持短期工作记忆和长期智能内存提供了强大的功能。
在这篇文章中,我们回顾了P6E-GB200 Ultraservers的技术规格,讨论其性能优势,并突出关键用例。然后,我们走过如何通过灵活的培训计划购买超声处理能力,并开始使用带有Sagemaker Hyperpod的Ultraservers。
这篇文章探讨了Indegene的社会情报解决方案如何使用高级AI来帮助生命科学公司从数字医疗对话中提取有价值的见解。该解决方案以AWS技术为基础,解决了HCP对数字渠道的日益偏好,同时克服了分析规模的复杂医学讨论的挑战。
Unlocking enhanced legal document review with Lexbe and Amazon Bedrock
在这篇文章中,法律文档审查软件公司Lexbe演示了他们如何整合亚马逊床架和其他AWS服务,以改变其文档审查流程,使法律专业人员能够使用生成AI立即查询和从大量案例文档中提取见解。通过与AWS的合作,Lexbe在召回率方面取得了重大提高,到2024年12月,高达90%,并开发了广泛的人类风格报告和跨多种语言的自动推断的能力。
Automate AIOps with SageMaker Unified Studio Projects, Part 2: Technical implementation
在这篇文章中,我们专注于通过逐步指导和参考代码实施此体系结构。我们提供了详细的技术演练,以满足AI开发生命周期中两个关键角色的需求:通过自动模板建立治理和基础设施的管理员,以及使用SageMaker Unified Studio用于模型开发的数据科学家,而无需管理基础设施。
Automate AIOps with Amazon SageMaker Unified Studio projects, Part 1: Solution architecture
这篇文章介绍了建筑策略和可扩展的框架,该框架可帮助组织管理多租户环境,始终如一地自动化自动化,并嵌入治理控制,因为它们可以与Sagemaker Unified Studio扩展AI计划。
Demystifying Amazon Bedrock Pricing for a Chatbot Assistant
在这篇文章中,我们将通过一个实用的现实世界示例的镜头来查看亚马逊基岩的价格:构建客户服务聊天机器人。我们将分解基本的成本组件,仔细研究中型呼叫中心实施的容量计划,并在不同的基础模型上提供详细的定价计算。
The DIVA logistics agent, powered by Amazon Bedrock
在这篇文章中,我们讨论了DTDC和Shellkode如何使用Amazon Bedrock构建Diva 2.0,这是一种生成的AI驱动物流代理。
Automate enterprise workflows by integrating Salesforce Agentforce with Amazon Bedrock Agents
这篇文章探讨了实用的合作,将Salesforce Force与Amazon Bedrock Agents和Amazon Redshift集成,以使Enterprise Workflows自动化。
How Amazon Bedrock powers next-generation account planning at AWS
在这篇文章中,我们分享了我们如何构建帐户计划脉冲,这是一种生成的AI工具,旨在使用亚马逊基岩(Amazon Bedrock)简化和增强帐户计划过程。 Pulse减少了审核时间,并提供了可行的帐户计划摘要,以便于协作和消费,从而帮助AWS销售团队更好地为客户服务。
Pioneering AI workflows at scale: A deep dive into Asana AI Studio and Amazon Q index collaboration
今天,我们很高兴地宣布Asana AI Studio与Amazon Q Index的集成,将Generative AI直接带入您的日常工作流程中。在这篇文章中,我们探讨了Asana AI Studio和Amazon Q索引如何通过智能工作流动自动化和增强的数据可访问性来改变企业效率。
Responsible AI for the payments industry – Part 1
这篇文章探讨了付款行业在扩展AI采用方面面临的独特挑战,塑造实施决策的监管方面的考虑以及应用负责AI原则的实用方法。在第2部分中,我们提供了实施策略,以在您的付款系统中运行负责的AI。
Responsible AI for the payments industry – Part 2
在我们系列的第1部分中,我们探索了付款行业中负责人AI的基础概念。在这篇文章中,我们讨论了负责任的AI框架的实际实施。
在这篇文章中,我们将使用Amazon Bedrock Data Automation和Amazon Sagemaker AI展示如何使用人类评论循环处理多页文档。
Build an AI assistant using Amazon Q Business with Amazon S3 clickable URLs
在这篇文章中,我们演示了如何使用Amazon Q业务来建立AI助手,该业务根据您存储在S3存储桶中的企业文档响应用户请求,以及用户如何在AI助手响应中使用参考网址以查看或下载引用文档,并验证AI响应的AI响应,以实践负责任的AI。
GPT OSS models from OpenAI are now available on SageMaker JumpStart
今天,我们很高兴地宣布,来自Amazon Sagemaker Jumpstart的OpenAI,Openai的Open AI开放式AI开放式GPT OSS模型,GPT-OSS-1220B和GPT-SOSS-20B。通过此发布,您现在可以部署Openai的最新推理模型来构建,实验和负责任地扩展您的生成AI想法。在这篇文章中,我们演示了如何在Sagemaker Jumpstart上开始这些模型。